Resource and Location Aware Robust Decentralized Data Management

نویسنده

  • Elizabeth Ribe-Baumann
چکیده

Increasingly, large amounts of data are being stored in a distributed manner over wide area networks. Such large scale networks most often employ heterogeneous nodes, with heterogeneity taking the form of available battery power, bandwidth, computing power, and/or network up-times, among other things. As smartphones have become an ubiquitous element of every-day life, the potential for large scale peer-to-peer networks with strong contrasts in peers’ capabilities has become undeniable. This scenario is especially relevant for disaster scenarios when access to existing data storage may be unavailable or inaccessible for the broad population, although important information about conditions, hazards, or injured people could be collected by general civilians. But networks built on a mix of smartphones, laptops, and servers are not the only heterogeneous systems with the potential to distributively store large amounts of data: sensor networks and computing clouds also contain nodes with varying characteristics. However, at the core of these distributed, heterogeneous networks is a necessity to accommodate nodes’ varying accessibility to resources and to reduce network load by providing short paths between where data is stored and needed, while ensuring a high level of data robustness, or availability. In fact, this resource and location awareness should be used to increase robustness. This work thus focuses on resource and location awareness for robust data management in decentralized, potentially peer-to-peer, networks. In order to facilitate the assessment and comparison of resource and location aware approaches, taxonomies are developed for the classification of how resources and proximity are handled. In addition to robustness, resource awareness, and location awareness, four further requirements are derived from this work’s use case scenarios: self-organization, scalability, load balancing, and data consistency. A structured network approach was chosen in order to provide availability guarantees for stored data. The lack of structured approaches with both resource and location awareness led to the development of two novel distributed hash tables (DHTs) Resource Based Finger Management (RBFM) and Hierarchical Resource Management (HRM), which are more and less loosely based on the existing DHT Chord and have the same O(logN) routing complexity. These two DHTs take fundamentally different structural approaches to building an overlay, such that the flat RBFM and the multi-tiered hierarchical HRM provide a foundation with which to examine the suitability of flat vs. hierarchical overlay structures for resource and location awareness. Moreover, HRM uses a variable number of hierarchical layers, facilitating also a comparisons of varying numbers of hierarchy layers. An additional hybrid version of both DHTs as well as a cluster-based version of RBFM for ad hoc networks are also described and used for simulative comparisons. Mathematical analysis and simulative evaluations of the developed DHTs in comparison with naive and location aware approaches demonstrate how resource awareness improve both node lifetimes and lookup success rates twofold when resources are correlated with node failure probabilities. However, a higher number of hierarchy layers causes an increase in overall routing and maintenance load, thus decreasing node lifetimes, so that a lower number of hierarchy layers is beneficial. DHTs require data replication to ensure that data is not lost when nodes unexpectedly leave the network, which is especially important in the high churn scenarios considered in this work. Thus, a replication technique is tailored to the resource and location aware structure of the proposed DHTs, providing both an increase in resource and location awareness as well as a reduction in the overall replication load. Mathematical analysis demonstrates how the number of replicas necessary to provide a given availability probability is significantly reduced while the remaining replica load is transferred from weak to strong nodes. Zusammenfassung Große Datenmengen werden zunehmend auf weite Netze, die oft aus heterogenen Knoten bestehen, verteilt. Dabei kann Heterogenität beispielsweise variable Batteriekapazität, Bandbreite, Rechenleistung oder auch Lebenszeiten beudeuten. Die weite Verbreitung von Smartphones im Alltag birgt ein Potenzial für große Peer-to-Peer Netzwerke, in dem Knoten stark variierende Leistungsfähigkeiten aufweisen. Dieses Szenario ist besonders für Katastrophen-Szenarien relevant, wenn der Zugang zu bereits existierenden Datenspeicherungsmöglichkeiten entweder unerreichbar oder unzugänglich für die Mehrheit der Bevölkerung ist. Gerade in einem Katastrophen-Szenario sammeln Zivilisten allein durch ihren Aufenthalt an weit verteilten Orten ständig eventuell wichtige Information über Zustände, Gefahren und verletzte Personen, die für weitere Verwendung und Koordinierung gesammelt werden sollten. Allerdings sind Netzwerke, die auf Smartphones, Laptops und Servern basieren, nicht die einzigen heterogenen Netzwerke, die große Datenmengen verwalten: Sensornetzwerke und Clouds bestehen ebenfalls aus Knoten mit variierenden Eigenschaften. Im Kern all dieser verteilen heterogenen Netzwerken besteht die Notwendigkeit, den variierenden Zugang der Knoten zu Ressourcen zu berücksichtigen und die Gesamtlast durch kurze Wege zwischen den Speicherungsorten und Anfrageorten der Daten möglichst zu minimieren. All dies ist allerdings einer hohen Verfügbarkeit der Daten unterstellt und es sollte sogar angestrebt werden die Verfügbarkeit der Daten gerade durch das Ressourcenund Lokationsbewusstsein zu verbessern. Die hier vorgestellte Arbeit konzentriert sich auf die Integration von Ressourcenund Lokationsinformationen für eine robuste Datenverwaltung in verteilten, vielleicht sogar Peer-to-Peer, Netzwerken. Um verschiedene ressourcenund lokationsbewusste Ansätze auszuwerten und zu vergleichen, wurden Taxonomien zur Klassifizierung der Nutzung von Ressourcen und Entfernungen entwickelt. Über Robustheit, Ressourcenbewusstsein und Lokationsbewusstsein hinaus wurden vier weitere Anforderungen für die zentralen betrachteten Anwendungsfälle hergeleitet: Selbstorganisation, Skalierbarkeit, Lastbalancierung und Datenkonsistenz. Ein strukturierter Netzwerkansatz wurde gewählt, um Verfügbarkeitsgarantien für die gespeicherten Daten bieten zu können. Ein Mangel an strukturierten Ansätzen, die sowohl Ressourcenals auch Lokationsbewusstsein nutzen, führte zu der Entwicklung von zwei neuen verteilten Hashtabellen (weiter DHT genannt): Resource Based Finger Management (RBFM) und Hierarchical Resource Management (HRM), die mehr oder weniger auf der existierenden Chord DHT aufbauen und ihre O(logN) Routingkomplexität beibehalten. Diese zwei DHTs nutzen grundsätzlich unterschiedliche Ansätze für den Aufbau des Overlays. So bilden die flache RBFM und die hierarchische HRM eine Grundlage, mit der die Eignung von flachen und hierarchischen Overlaystrukturen für Ressourcenals auch Lokationsbewusstsein verglichen werden kann. Darüber hinaus verwendet HRM eine variable Anzahl an Hierarchieebenen, womit ein Vergleich zwischen verschiedenen Ebenenanzahlen ermöglicht wird. Weiterhin werden eine zusätzliche hybride Version von beiden DHTs sowie eine cluster-basierte Version von RBFM für ad hoc Netzwerke beschrieben und für simulationsbasierte Vergleiche benutzt. Eine mathematische Analyse und simulationsbasierte Evaluation der entwickelten DHTs zeigen, wie Ressourcenbewusstsein sowohl die Lebensdauer der Knoten als auch die Erfolgsrate der Anfragen gegenüber einem völlig naiven Ansatz und einen nur lokationsbewussten Ansatz um das zweifache erhöht, wenn angenommen wird, dass die Ausfallwahrscheinlichkeit der Knoten mit den Ressourcen der Knoten korreliert. Allerdings wurde festgestellt, dass eine hohe Anzahl von Hierarchieebenen die gesamte Routingund Wartungslast ebenfalls erhöht und somit die Lebensdauer der Knoten reduziert, sodass eine niedrige Ebenenanzahl von Vorteil ist. Um zu versichern, dass Daten nicht verloren gehen, wenn Knoten unerwartet das Netzwerk verlassen, benötigen DHTs Replikation. Deshalb wurde eine Replikationsstrategie entwickelt, welche die resourcenund lokationsbewusste Struktur der vorgestellten DHTs ausnutzt. Diese Strategie erhöht somit das Ressourcenund Lokationsbewusstsein während die Gesamtlast für der Replikation verringert wird. Eine mathematische Analyse zeigt, wie die Anzahl der benötigten Replikate signifikant gesenkt werden kann um eine vorgegebene Verfügbarkeitswahrscheinlichkeit zu erreichen, während die übrige Ressourcenlast von den schwachen auf den starken Knoten verschoben wird.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Decentralized, Resource-Aware Information Management and Delay Tolerant Networks in Command-and-Control

A robust, decentralized information management system and reliable transport of information between disconnected agents is essential to the success of command and control activities in disaster relief scenarios. We present work-in-progress aimed at developing a distributed hash table (DHT) protocol and a delay-tolerant network that meet the specific requirements of disaster relief scenarios thr...

متن کامل

Decentralized Routing and Power Allocation in FDMA Wireless Networks based on H∞ Fuzzy Control Strategy

Simultaneous routing and resource allocation has been considered in wireless networks for its performance improvement. In this paper we propose a cross-layer optimization framework for worst-case queue length minimization in some type of FDMA based wireless networks, in which the the data routing and the power allocation problem are jointly optimized with Fuzzy distributed H∞ control strategy ....

متن کامل

OPTIMIZATION OF MULTI PERIOD - MULTI LOCATION CONSTRUCTION PROJECTS CONSIDERING RESOURCE POOL AND BATCH ORDERING

During the past two decades, some industries have been moving towards project-centered systems in many modern countries. Therefore, managing simultaneous projects with considering the limitations in resources, equipment and manpower is very crucial. In the real world, project-based organizations are always facing with two main important features. First, the construction projects are decentraliz...

متن کامل

Energy Aware Resource Management of Cloud Data Centers

Cloud Computing, the long-held dream of computing as a utility, has the potential to transform a large part of the IT industry, making software even more attractive as a service and shaping the way IT hardware is designed and purchased. Virtualization technology forms a key concept for new cloud computing architectures. The data centers are used to provide cloud services burdening a significant...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2015